Entrega Final - Series Cronológicas

Facultad de Ciencias Económicas y Administración - 2025 - UDeLaR

Author

Leandro Berrueta, Lucca Frachelle, Cecilia Waksman

Published

June 24, 2025

1 Resumen Ejecutivo

Un resumen para hacer al final.

Falta:

  • Interpretación de los indicadores de predicción. Comentarios finales sobre los modelos en base a ello.

2 Introducción

El presente trabajo se desarrollará en base a la serie mensual de la cantidad de clientes con deuda vigente en el Banco Santander durante el período de Diciembre 2018 a Marzo 2025, proveniente de la central de riesgos que se informa al Banco Central del Uruguay (BCU). La serie se encuentra constituida, entonces, por 76 observaciones.

Dada la baja cantidad de observaciones disponibles se utilizará, a los efectos de identificar el modelo que logre representar el comportamiento de la serie, los datos de hasta Diciembre del 2024 inclusive (73 observaciones en total). Las tres observaciones restantes, referidas al año corriente, serán utilizadas con el fin de contrastar el desempeño de la predicción.

3 Análisis Inicial

3.1 Gráfico de la Serie Temporal

Una primera visualización de la serie permite identificar una clara tendencia creciente a lo largo del tiempo, especialmente a partir de mediados del año 2020, con un aumento significativo a fines de 2023 de cara al año 2024.

En principio no se logra reconocer un comportamiento estacional evidente o un patrón repetitivo a intervalos fijos en la serie.

A su vez, una inspección inicial de la serie sugiere que la misma podría presentar observaciones atípicas, en particular a fines de 2019, fines de 2021 y fines de 2023.

La variabilidad parece aumentar ligeramente con el nivel de la serie, lo que podría sugerir la necesidad de aplicar una transformación logarítmica a modo de homogeneizar la Varianza de la serie. El uso de dicha transformación se evaluará más adelante tomando como insumo el comportamiento del cuadrado de los residuos de los modelos propuestos.

3.2 Estadísticas Descriptivas

Estadísticas Descriptivas de la Serie de Cantidad de Personas con Deuda
Estadística Valor
Min. 332198
1st Qu. 353361
Median 394463
Mean 395286
3rd Qu. 432958
Max. 495587

4 Identificación del Modelo

4.1 Análisis de la Serie Original en el Dominio del Tiempo

4.1.1 Análisis en el Dominio del Tiempo: Función de Autocorrelación (FAC)

Se observa que la Función de Aucorrelación (FAC) decrece lentamente y de forma persistente, con coeficientes de autocorrelación significativos que se mantienen altos incluso en los mayores rezagos y que, por ende, no se comportan de acuerdo al decaimiento exponencial que caracteriza a las series débilmente estacionarias1. Esto es un fuerte indicio de que la serie no es estacionaria.

Además, las autocorrelaciones significativas en rezagos altos sugieren la presencia de una tendencia, detalle claramente observable al inspeccionar el gráfico de la serie.

4.1.2 Análisis en el Dominio del Tiempo: Función de Autocorrelación Parcial (FACP)

La Función de Autocorrelación Parcial (FACP) muestra un coeficiente significativo en el primer rezago y luego decae rápidamente, no habiendo otro rezago que resulte significativo al nivel de significación usual del 5%.

Esto podría sugerir un componente \(\text{AR}(1)\) si la serie fuese estacionaria. Sin embargo, dada la FAC planteada anteriormente así como los comentarios realizados en base a esta y al gráfico de la propia serie, se concluye de este primer análisis del Dominio del Tiempo en la posibilidad de aplicar, al menos, una primera diferencia regular a la misma.

4.1.3 Análisis en el Dominio de Frecuencias de la Serie Original

Mediante el Periodograma Suavizado de la serie es posible respaldar la idea de que la misma presenta una tendencia que debería ser modelada.

En particular, las frecuencias más próximas a \(0\), y por ende las asociadas a ciclos de período próximo a infinito (el componente tendencial) explican la mayor parte de la variabilidad de la serie2.

4.1.4 Contrastes de Raíces Unitarias

A la hora de determinar si la tendencia puede ser modelada de forma determinística o si la misma es resultado de la presencia de raíces unitarias que motiven la aplicación de una Primera Diferencia Regular se lleva acabo los Contrastes de Dickey-Fuller Aumentado (DF o DFA) y Kwiatkowski-Phillips-Schmidt-Shin (KPSS).

4.1.4.1 Dickey-Fuller Aumentado

En primera instancia se planteó el contraste seleccionando la cantidad de rezagos por medio de Criterios de Información (AIC y BIC) lo que resulta en la elección de \(p = 1\). Con este valor, sin embargo, no se logró el comportamiento deseado de los residuos (que los mismos no se encuentren autocorrelacionados), lo que motivó el ensayo con varios valores de lags adicionales. Esto resultó en la elección de \(p = 2\), con ambos coeficientes significativos a los niveles de significación usuales.

A continuación se presentan los resultados de la regresión auxiliar del test y los estadísticos de prueba:

Regresión del Test de Dickey-Fuller Aumentado
Characteristic Beta1 SE 95% CI p-value
(Intercept) 22,500 24,030 -25,491, 70,490 0.4
z.lag.1 -0.07 0.076 -0.22, 0.09 0.4
tt 212 162 -111, 534 0.2
z.diff.lag



    z.diff.lag1 -0.48*** 0.122 -0.72, -0.23 <0.001
    z.diff.lag2 -0.43*** 0.116 -0.66, -0.20 <0.001
Abbreviations: CI = Confidence Interval, SE = Standard Error
1 *p<0.05; **p<0.01; ***p<0.001
Resultados del Test de Dickey-Fuller Aumentado
Estadístico VC.1. VC.5. VC.10.
tau3 (con tendencia) -0.8745181 -4.04 -3.45 -3.15
phi2 9.9484835 6.50 4.88 4.16
phi3 2.3435201 8.73 6.49 5.47

Del contraste de Dickey-Fuller aumentado se concluye que:

  • No se rechaza la Hipótesis Nula de que la Serie presente una raíz unitaria a ninguno de los niveles de significación planteados. De esta manera se tiene un respaldo estadístico para aplicar la Primera Diferencia Regular.

4.1.5 KPSS

En segunda instancia se plantea el Contraste KPSS. Los resultados se muestran a continuación:

Resultados del Test KPSS (con tendencia)
Item Valor
Estadístico de Test 0.2567046
Valor Crítico 10% 0.1190000
Valor Crítico 5% 0.1460000
Valor Crítico 2.5% 0.1760000
Valor Crítico 1% 0.2160000

Como resultado se rechaza la Hipótesis Nula de que la Serie sea Integrada de Orden \(0\), lo que nuevamente da un respaldo estadístico para la aplicación de la Primera Diferencia Regular en los datos.

4.2 Serie Diferenciada de acuerdo a la Primera Diferencia Regular

La Primera Diferencia Regular tiene como resultado una serie que adquiere un comportamiento más próximo al estacionario que la serie original.

En principio es posible observar que la tendencia ha sido eliminada y la Media parece ser constante. No obstante, la Varianza no se comporta de igual forma, lo que sugiere, nuevamente, la posible presencia de datos atípicos, particularmente a fines de los años 2019, 2021 y 2023.

Considerando los años por separado, como se plantea en el gráfico siguiente, es posible observar que la serie diferenciada se comporta de forma similar en todos los años disponibles, con la excepción de los años 2019 y 2023, en los meses de Septiembre y Octubre en particular. Esto es un indicio de posibles outliers que requieran intervención.

Separando los datos de acuerdo a los meses se desprende que los meses de Marzo, Junio, Septiembre y Diciembre presentan medias mayores en comparación al resto de los meses.

4.2.1 FAC y FACP de la Serie Diferenciada

Al analizar la Función de Autocorrelación de la serie una vez aplicada la Primera Diferencia Regular (\(d=1\)), se observa que el lento decaimiento de los coeficientes de autocorrelación fue subsanado. No obstante, persisten patrones significativos.

Específicamente, se nota la presencia de coeficientes significativos en los rezagos \(3, \ 6, \ 9\), con una rápida aproximación a las bandas de confianza.

Los coeficientes asociados a los rezagos \(12\) y \(24\) también resultan significativos, lo que constituye un indicio de que la serie presente un componente estacional.

De esta manera se puede destacar que las observaciones se encuentran autocorrelacionadas con sus valores de 3, 6 y 9 meses atrás. Este comportamiento sugiere la utilización, en principio, de un modelo \(\text{SARIMA}(3,1,0)(P,D,Q)\), bajo el argumento de que la FAC se comporta como la que presenta un \(\text{AR}(3)\) con \(\phi_1 = \phi_2 = 0\).

4.2.2 Dominio de Frecuencias: Análisis del Espectro de la Serie Diferenciada

El Espectro también muestra como la Primera Diferencia Regular elimina el componente tendencial, al presentar bajos valores en las frecuencias más bajas. No obstante, es posible observar como se realza el peso de las frecuencias que se encuentran en torno a \(\omega_{\max} = 2.10\).

Considerando que \(\text{per}(\omega_j) = \frac{2\pi}{\omega_j}\), entonces se tiene que \(\text{per}(\omega_{\max}) \approx 3\), lo que quiere decir que la aplicación de la Primera diferencia Regular tuvo como resultado el incrementar la importancia de los ciclos que se repiten cada 3 meses a la hora de explicar la variabilidad de la serie.

Esto constituye un fundamento para la utilización de \(p=3\) en la modelización de la serie diferenciada o de la aplicación de una Primera Diferencia Estacional de período 3, como se había mencionado en el Análisis en el Dominio del Tiempo efectuado anteriormente.

PREGUNTA: ¿El hecho de que los ciclos que más explican la varianza sean los de período 3 puede ir de la mano con lo que indicaba Lucca de que entran deudores a los 3 meses (2+1)? Esto puede estar bueno comentarlo acá, así como al inicio del documento, para dar un fundamento teórico al hallazgo.

4.2.3 Contrastes de Raíces Unitarias

Se procedió a llevar los contrastes de Dickey-Fuller Aumentado y KPSS a efectos de determinar si es necesaria la aplicación de una Segunda Diferencia Regular en la serie.

4.2.3.1 Dickey-Fuller Aumentado

En primera instancia se planteó el contraste seleccionando la cantidad de rezagos por medio de Criterios de Información (AIC y BIC) lo que resulta en la elección de \(p = 1\). Con dicha cantidad de rezagos los residuos no se encuentran autocorrelacionados, por lo que, al contrario de la aplicación del contraste en la serie original, no se realiza el ensayo con otros lags.

Regresión del Test de Dickey-Fuller Aumentado
Characteristic Beta1 SE 95% CI p-value
(Intercept) 4,197*** 853 2,494, 5,900 <0.001
z.lag.1 -1.9*** 0.187 -2.3, -1.5 <0.001
z.diff.lag 0.42*** 0.114 0.19, 0.65 <0.001
Abbreviations: CI = Confidence Interval, SE = Standard Error
1 *p<0.05; **p<0.01; ***p<0.001
Resultados del Test de Dickey-Fuller Aumentado
Estadístico VC.1. VC.5. VC.10.
tau2 (con constante) -10.23177 -3.51 -2.89 -2.58
phi1 52.41887 6.70 4.71 3.86

Del contraste de Dickey-Fuller aumentado se concluye que:

  • Se rechaza la Hipótesis Nula de que la Serie presente una raíz unitaria en todos los niveles de significación planteados. De esta manera se tiene un respaldo estadístico para continuar trabajando con la serie diferenciada, en el sentido de que la misma sea estacionaria.

4.2.3.2 KPSS

En segunda instancia se plantea el Contraste KPSS, lo que resulta en el no rechazo de la Hipótesis Nula de que la serie sea Integrada de Orden \(0\), lo que nuevamente da un respaldo estadístico para continuar trabajando con la serie diferenciada, sin aplicar una Segunda Diferencia Regular (\(d = 2\)).

Resultados del Test KPSS (con constante)
Item Valor
Estadístico de Test 0.2987105
Valor Crítico 10% 0.3470000
Valor Crítico 5% 0.4630000
Valor Crítico 2.5% 0.5740000
Valor Crítico 1% 0.7390000

4.3 Serie Diferenciada de acuerdo a Primera Diferencia Regular y Primera Diferencia Estacional

En este caso corresponde observar la FAC y FACP en los múltiplos de \(12\). Se observa la significación tanto del primer coeficiente de autocorrelación como de autocorrelación parcial, lo que sugiere la utilización de \((P = 1, D = 1, Q = 0)[12]\) o \((P = 0, D = 1, Q = 1)[12]\) para la parte estacional de un primer modelo \(\text{SARIMA}\).

En el Análisis en el Dominio de Frecuencias es posible observar como la Primera Diferencia Regular en conjunto con la Primera Diferencia Estacional resultan en un Periodograma Suavizado semejante al de un Ruido Blanco.

Dada dicha particularidad se observó el comportamiento del Periodograma Original, donde se alcanzan picos sucesivos en las frecuencias más altas, lo que está asociado a ciclos de período bajo.

5 Modelo Final Propuesto: SARIMA(2,1,0)(1,1,0)

A continuación, se presenta el modelo \(\text{SARIMA}\) finalista seleccionado para la serie temporal. El mismo ha sido ajustado con intervención de valores atípicos y sometido a un riguroso proceso de diagnóstico.

6 Procedimiento de Obtención del Modelo

Se partió de un Modelo \(\text{SARIMA}(3,1,0)(0,0,0)[12]\) de acuerdo a lo expuesto en el análisis de la FAC y FACP desarrollado previamente. En particular, se había identificado:

  • Coeficientes significativos en la FAC y FACP en el tercer rezago, así como significativos y con decaimiento a medida que aumenta el rezago en los que resultan múltiplos de 3. De esta manera se desprende utilizar \(p = 3\) con \(\phi_1 = \phi_2 = 0\) a la hora de modelar la parte regular de la serie.

  • Los coeficientes significativos de la FAC y FACP de la serie resultante de aplicar tanto la Primera Diferencia Regular como Primera Diferencia Estacional en el doceavo retardo determinan el uso de \(P = 1\) o \(Q = 1\).

Si bien se resalta la existencia de un componente estacional a modelar se decide no hacerlo priorizando la identificación de puntos anómalos3.

El modelo resultante presenta el coeficiente \(\phi_3\) de la parte \(\text{AR}\) significativo a todos los niveles de significación usuales4. El modelo ajustado resultante es:

Coeficientes del Modelo SARIMA(3,1,0)(0,0,0)[12]
Characteristic Beta1 SE 95% CI p-value
ar1 0.00 0.000

ar2 0.00 0.000

ar3 0.52*** 0.101 0.32, 0.72 <0.001
Abbreviations: CI = Confidence Interval, SE = Standard Error
1 *p<0.05; **p<0.01; ***p<0.001
Criterios de Información del Modelo Inicial
AIC AICc BIC
1472.034 1472.208 1476.587

Una primera observación de los residuos estandarizados indicó la presencia de outliers. A su vez, se rechazó la Hipótesis Nula de Normalidad en los contrastes de Shapiro-Wilk y Jarque-Bera, lo que motivó la intervención de los siguientes puntos anómalos:

  • Outlier Aditivo en Setiembre de 2019.

  • Cambio Transitorio en Diciembre de 2019.

  • Cambio Transitorio en Diciembre de 2021.

  • Outlier Aditivo en Febrero de 2023.

  • Outlier Aditivo en Agosto de 2023.

  • Cambio Transitorio en Octubre de 2023.

  • Cambio Transitorio en Junio de 2024.

Recuérdese que se había planteado durante la inspección inicial de la serie la posibilidad de que hubieran observaciones atípicas a fines de los años 2019, 2021 y 2023, lo que es consistente con el resultado anterior5

Si bien la cantidad de outliers intervenidos supera la proporción límite, arbitraria pero recomendada, de intervenciones (9.5% aproximadamente contra 5%), tiene como resultado el cumplimiento de varios supuestos en la etapa de diagnóstico, aunque requiriendo previamente la redefinición del orden del modelo.

Realizadas las intervenciones se modela la estacionalidad, por medio de \(P=1\) o \(Q=1\), en base a los observaciones realizadas sobre la FAC y FACP de la serie resultante de aplicar la Primera Diferencia Regular y Estacional. Como resultado se pierde la significación del coeficiente \(\phi_3\) de la parte regular, lo que motiva la redefinición del modelo en un \(\text{SARIMA}(2,1,0)(1,1,0)[12]\).

Por un lado, en la parte regular no resulta significativo el coeficiente \(\phi_1\), por lo que se lo fijó en \(0\). Por otro lado, en la parte estacional se decidió utilizar \(P=1,D=1,Q=0\) en vez de \(P=0,D=1,Q=1\) dado que el coeficiente de la parte \(\text{AR}\) asociado a la primera modelización presenta un menor p-valor que el coeficiente de la parte \(\text{MA}\) de la segunda6.

6.1 Ajuste del Modelo Final

Se estima, finalmente, el siguiente modelo:

Coeficientes del Modelo SARIMA(2,1,0)(1,1,0)
Characteristic Beta1 SE 95% CI p-value
ar1 0.00 0.000

ar2 0.44*** 0.124 0.19, 0.68 <0.001
sar1 -0.48** 0.150 -0.77, -0.18 0.002
AO10 19,189*** 1,829 15,603, 22,774 <0.001
TC13 17,394*** 2,542 12,412, 22,376 <0.001
TC37 11,534*** 1,978 7,658, 15,411 <0.001
AO51 5,588*** 1,557 2,536, 8,641 <0.001
AO57 7,679*** 1,637 4,470, 10,888 <0.001
TC59 -11,055*** 2,235 -15,436, -6,674 <0.001
TC67 -13,023*** 2,419 -17,763, -8,282 <0.001
Abbreviations: CI = Confidence Interval, SE = Standard Error
1 *p<0.05; **p<0.01; ***p<0.001

6.2 Criterios de Información y Medidas de Error

Como resultado se obtiene una disminución significativa en los tres Criterios de Información utilizados respecto al modelo inicial:

Criterios de Información del Modelo SARIMA(2,1,0)(1,1,0)
AIC AICc BIC
1140.64 1145.13 1161.583

Y las medidas de error que serán objeto de análisis en la sección de Predicción:

Medidas de Error del Modelo SARIMA(2,1,0)(1,1,0)
ME RMSE MAE MPE MAPE MASE ACF1
Training set 312.1445 2426.677 1788.985 0.0756968 0.4437388 0.0718602 0.1243762

6.3 Diagnóstico de Residuos

A su vez los residuos presentan un buen comportamiento evidenciado por la FAC y FACP de los mismos, donde no hay coeficientes de autocorrelación ni autocorrelación parcial que resulten significativos.

6.3.1 Test de Ljung-Box

No obstante, los p-valores asociados al contraste de Ljung-Box resultan particularmente bajos, lo que sugiere que esta modelización puede estar incumpliendo el supuesto de residuos no autocorrelacionados.

Test de Ljung-Box para Residuos del Modelo SARIMA(2,1,0)(1,1,0) (Rezagos 3, 6, 9, 12 y 24)
statistic p.value parameter method
3.459295 0.0000000 0 Box-Ljung test
3.699865 0.2957504 3 Box-Ljung test
11.753917 0.0676892 6 Box-Ljung test
14.198213 0.1154471 9 Box-Ljung test
31.505574 0.0656457 21 Box-Ljung test

6.3.2 Análisis de Normalidad y Homocedasticidad

Los Contrastes de Normalidad resultan en el no rechazo de la correspondiente Hipótesis Nula, por lo que no se dispone de evidencia estadísticamente significativa de que los residuos no se distribuyan de acuerdo a una Distribución Gaussiana.

Tests de Normalidad para Residuos del Modelo SARIMA(2,1,0)(1,1,0)
Test statistic p.value method parameter
Shapiro-Wilk 0.9863716 0.6212044 Shapiro-Wilk normality test NA
Jarque-Bera 0.7470338 0.6883093 Jarque Bera Test 2

A efectos de evaluar el cumplimiento del supuesto de Homocedasticidad o Varianza Constante, se planteó el contraste de Ljung-Box así como la FAC y FACP del cuadrado de los residuos. En el primero se observa la significación de los coeficientes de autocorrelación y autocorrelación parcial de orden 6, lo que sugiere el incumplimiento del supuesto. No obstante, los resultados del contraste de Ljung-Box hacen que se desestime esta idea.

Test de Ljung-Box para el Cuadrado de los Residuos del Modelo SARIMA(2,1,0)(1,1,0) (Rezagos 3, 6, 9, 12 y 24)
statistic p.value parameter method
3.459295 0.0000000 0 Box-Ljung test
3.699865 0.2957504 3 Box-Ljung test
11.753917 0.0676892 6 Box-Ljung test
14.198213 0.1154471 9 Box-Ljung test
31.505574 0.0656457 21 Box-Ljung test

6.3.3 Contraste de Media Nula de los Residuos

Finalmente se lleva acabo un contraste de hipótesis a efectos de determinar si las perturbaciones tienen media nula:

Tests de Media Nula para Residuos del Modelo SARIMA(2,1,0)(1,1,0)
estimate statistic p.value parameter
312.1445 1.100609 0.2747331 72

No se rechaza la Hipótesis Nula de que los residuos tengan una media distinta de \(0\), por lo que se culmina la etapa de diagnóstico del modelo.

7 Predicción

El Modelo a utilizar es un \(\text{SARIMA}(2,1,0)(1,1,0)\) con \(\phi_1 = 0\), que puede expresarse como:

\[ (1-L)(1-L^{12})(1-L^2{\phi}_2)(1-L{\Phi}_1)Y_t = \epsilon_t \]

Donde \(Y_t\) denota a la serie de datos original, \(L\) al operador de retardos y \(\epsilon_t\) un ruido blanco. \({\phi}_2\) y \({\Phi}_1\) son los coeficientes respectivas de las partes AR del componenente Regular y Estacional del Modelo.

7.1 Enero, Febrero y Marzo de 2025

Se realiza predicciones para los meses de Enero, Febrero y Marzo de 2025, a efectos de contrastarla con las tres observaciones que no se utilizaron a la hora de ajustar el modelo.

Intervalos de Confianza al 50% de los Primeros 3 Meses de 2025 contra Realidad
Fecha Límite Inferior 50% Predicción Límite Superior 50% Realidad Capturado
Enero - 2025 494652.4 496610.6 498568.8 496939 Si
Febrero - 2025 493933.3 496702.7 499472.1 504989 No
Marzo - 2025 499202.9 503148.9 507094.8 504575 Si
Intervalos de Confianza al 75% de los Primeros 3 Meses de 2025 contra Realidad
Fecha Límite Inferior 75% Predicción Límite Superior 75% Realidad Capturado
Enero - 2025 493270.8 496610.6 499950.4 496939 Si
Febrero - 2025 491979.5 496702.7 501425.9 504989 No
Marzo - 2025 496419.1 503148.9 509878.7 504575 Si
Intervalos de Confianza al 90% de los Primeros 3 Meses de 2025 contra Realidad
Fecha Límite Inferior 90% Predicción Límite Superior 90% Realidad Capturado
Enero - 2025 491835.1 496610.6 501386.1 496939 Si
Febrero - 2025 489949.2 496702.7 503456.2 504989 No
Marzo - 2025 493526.1 503148.9 512771.7 504575 Si
Intervalos de Confianza al 96% de los Primeros 3 Meses de 2025 contra Realidad
Fecha Límite Inferior 96% Predicción Límite Superior 96% Realidad Capturado
Enero - 2025 490648.0 496610.6 502573.2 496939 Si
Febrero - 2025 488270.3 496702.7 505135.1 504989 Si
Marzo - 2025 491133.9 503148.9 515163.8 504575 Si

Se puede apreciar que se captura al 50% de confianza el valor real de la serie en los meses de Enero y Marzo de 2025. Sin embargo, el valor de Febrero de 2025 requiere utilizar un intervalo de amplitud mayor asociado a una confianza aproximada del 96%.

Métricas sobre los errores de predicción

Se obtiene algunas medidas de los errores de predicción sobre el conjunto de testeo. Para ello los errores son tomados como la diferencia en cada punto de la serie entre el conjunto de testeo (los valores reales) y los valores predichos, es decir, \((x - \hat{x})\).

Métricas de Predicción - SARIMA\((2,1,0)(1,1,0)\)
ME RMSE MAE MPE MAPE MASE ACF1 Theil’s U
Training set 312.1445 2426.677 1788.985 0.0757 0.4437 0.0719 0.1244 NA
Test set 3346.9395 4858.133 3346.939 0.6632 0.6632 0.1344 -0.6559 1.0427

Un ME (Mean Error o Error Medio) positivo implica que el modelo en promedio subestima. Es posible ver con qué porcentaje al observar el MPE (Mean Percentage Error o Error Medio Porcentual). En el caso de las predicciones a un paso sobre el conjunto de entrenamiento7, los errores se compensan lo suficiente generando que dicha subestimación sea considerablemente pequeña, con un PME de solo el 7,6%. Por otro lado, para los errores de predicción sobre el conjunto de testeo, la subestimación es relativamente grande, en promedio de un 66%, lo que está explicado por la predicción referida a Febrero de 2025.

El MAE (Mean Absolute Error o Error Absoluto Medio) presenta un error en términos absolutos que, para ambos casos, en comparación con el rango de valores de la serie, no parece ser tan alto. Sin embargo, el MAPE (Mean Absolute Percentage Error o Error Medio Absoluto Porcentual), el cual muestra dichos errores en términos relativos, es considerablemente alto. El modelo comete en promedio un 44% de error relativo respecto al valor real para el caso del set de entrenamiento y un 66% para el caso de los tres meses de 2025.

Es preciso señalar que los valores de ME y MAE son prácticamente los mismos para el set de testeo, lo que es producto de que en las tres predicciones realizadas se subestimó el valor real de la serie, como se pudo bien observar en gráficos anteriores.

El RMSE (Root Mean Square Error o Raiz Media de los Errores al Cuadrado), el cual tiene la característica de penalizar errores grandes, si bien es más alto que el MAE para ambos casos, en proporción a la media de la serie representa solo un 0,6% y un 1% respectivamente. De esta manera no se presenta errores extremadamente grandes en las predicciones al comparar con el promedio de la serie.

El MASE (Mean Absolute Scaled Error o Error Medio Absoluto Escalado) es una métrica que compara el MAE de la predicción con el MAE que se obtiene al utilizar un modelo naive de un lag. En este caso el modelo planteado predice ampliamente mejor que uno naive, ya que los valores 7,2%, para el set de training, y 13,5%, para el set de testeo, son extremadamente bajos.

Por su lado, el ACF1 (Autocorrelation of errors at lag 1 o Autocorrelación de los Errores en el Rezago 1), medida de la correlación entre errores a un rezago, muestra que existe poca correlación entre los errores del set de training, mientras que para el set de testeo parece existir cierta correlación negativa.

Por último, la Métrica de Theil’s U (Theil’s Inequality Coefficient) para el set de testeo es mayor que 1, esto sugiere que las predicciones son inexactas.

7.2 2024 y 2025

También se realiza predicciones para el 2024 y los primeros tres meses de 2025, utilizando el mismo modelo propuesto pero entrenándolo con las observaciones disponibles hasta diciembre de 2023.

De forma similar al modelo anterior se nota una diferencia en la pendiente de la predicción puntual y la realidad. Nuevamente, la primera tiende a ser cada vez menor que la segunda a medida que aumenta el horizonte de predicción.

Métricas sobre los errores de predicción

Métricas de Predicción - SARIMA\((2,1,0)(1,1,0)\)
ME RMSE MAE MPE MAPE MASE ACF1 Theil’s U
Training set 107.9246 2461.756 1768.281 0.0339 0.4512 0.0753 0.1116 NA
Test set 14604.1749 18096.407 14604.175 3.0075 3.0075 0.6222 0.7409 2.9412

Los errores en el nuevo set de entrenamiento8 presentan métricas muy similares a las de las predicciones del punto anterior. Solo el ME, en conjunto con el MPE en términos relativos, disminuyó notablemente. Esto implica que los errores en promedio se compensan aún más.

En el caso del set de testeo, las métricas de los errores en general empeoraron, lo cual es esperable tomando en cuenta que el horizonte de predicción es ahora considerablemente más lejano.

Según el ME y el MPE, se subestima ampliamente los valores de la serie empírica. Esto se puede observar claramente en el gráfico inmediato anterior.

El RMSE y el MAE también aumentaron notablemente. Aunque en comparación con la escala no parecen ser tan altos y en proporción a la media solo representan un 8%.

Analizándolo en términos relativos, el MAPE implica un error de predicción muy alto.

Por su parte, el MASE, al ser menor que 1, sugiere que se predice mejor que con un modelo naive.

En este caso el ACF1 indica una posible correlación positiva entre los errores.

Finalmente, el Theil’s U muestra un valor considerablemente alejado de 0, entendiéndose que las predicciones presentan errores bastante altos.

7.3 A partir de Junio de 2024

Considerando una muestra de entrenamiento con límite en Junio de 2024, tal que se incorpore el cambio transitorio identificado para ese mes, se obtiene los siguientes resultados para un horizonte de predicción hasta Marzo de 2025:

La predicción para los siguientes meses resulta bastante precisa. Es solo a partir de Diciembre del 2024 que se observa una discrepancia relativamente mayor con la serie empírica con tendencia a subestimar.

Métricas sobre los errores de predicción

Métricas de Predicción - SARIMA\((2,1,0)(1,1,0)\)
ME RMSE MAE MPE MAPE MASE ACF1 Theil’s U
Training set 247.9815 2393.661 1743.755 0.0638 0.4397 0.076 0.1366 NA
Test set 5983.7858 8183.217 6172.520 1.2035 1.2432 0.269 0.6178 1.1937

Para este último período de predicción, las métricas para el conjunto de entrenamiento9 resultan también muy parecidas a las resultantes de entrenar el modelo con los anteriores dos períodos.

Por otro lado, para el set de testeo, las métricas son en general mejores que las del anterior período tomado, pero relativamente peores que las del primero. Esto es de esperarse nuevamente debido al horizonte de predicción, de menor extensión que en el punto anterior, y al hecho de que se contempla el efecto de un nuevo dato atípico.

La subestimación según el ME y el MPE continúa siendo alta, y nuevamente el RMSE no resulta grande en comparación a la escala de la serie.

Según el MASE, el modelo propuesto predice mejor en comparación con un modelo naive.

En general las métricas en general sugieren errores de predicción altos para la muestra de testeo en comparación con los que resultan a un paso en la muestra de entrenamiento.

8 Descomposición de la Serie

Mediante la función x13 (asociada al método estadístico del mismo nombre) del paquete RJDemetra se llevó acabo la descomposición de la serie (de acuerdo a términos aditivos), tomando en cuenta el Modelo Final planteado anteriormente10

Como resultado se obtuvo la descomposición de la serie, lo que permitió computar una serie desestacionalizada, que se muestra a continuación:

En el primer gráfico es posible observar la serie original, mientras que su versión desestacionalizada puede apreciarse en el segundo. Se puede notar como la serie se ha vuelto más suave, no reflejando las periodicidades de la serie original. En el tercer gráfico se compara la serie desestacionalizada con el componente tendencial, siendo posible identificar los apartamientos de la tendencia debido a los outliers destacados en el desarrollo del presente trabajo11.

De interés puede ser observar el componente estacional y el irregular por separado:

Por un lado, el componente estacional se comporta de forma esperable, presentando, en general, picos de altura similar cada 12 meses. Esto se condice con la estacionalidad identificada al graficar la serie diferenciada de acuerdo al año: cada mes se comporta de forma similar todos los años.

El componente irregular, por otro lado, refleja en su comportamiento la inclusión de los outliers, que fueron de tipo aditivo y de cambio transitorio.

Finalmente, a las predicciones realizadas en el punto anterior, se le agrega las predicciones de los componentes tendencial así como de la serie desestacionalizada:

Se espera, entonces, que la tendencia de la Cantidad de Clientes con Deuda en el Banco Santander continúe aumentando en el tiempo, más allá de la estacionalidad que caracteriza a la serie.

9 Comentarios Finales

Respecto al modelo \(\text{SARIMA}(2,1,0)(1,1,0)\) se debe tener en cuenta que:

  • Se logra el no rechazo de los Contrastes de Normalidad utilizando siete intervenciones por atípicos, lo que dada la baja cantidad de observaciones disponibles puede resultar un número no deseable.

  • El supuesto de residuos no autocorrelacionados puede no estar cumpliéndose, tal y como se refleja en los p-valores del Contraste de Ljung-Box, que resultan cercanos al 5%.

  • Dadas dos muestras de entrenamiento se observó la tendencia a subestimar por parte del modelo.

No obstante lo anterior, esta modelización presenta los siguientes puntos a destacar:

  • El modelo \(\text{SARIMA}\) resultante es de bajo orden, lo que va de la mano con la idea de que los modelos de este tipo sean los mejores a la hora de predecir, además de resultar más parsimoniosos.

  • Dado que no se presenta problemas de homocedasticidad y a que, como se había mencionado al principio del presente trabajo, la transformación logarítmica no logra homogeneizar la Varianza de la serie, se descarta la aplicación de dicha transformación.

  • Se logra predecir con éxito a un bajo nivel de confianza dos de tres valores que tomó la serie en 2025: los asociados a los meses de Enero y Marzo. En el caso de Febrero se subpredice el valor que toma efectivamente la serie.

Footnotes

  1. En el presente trabajo se utilizará como sinónimos “estacionariedad en sentido débil”, “estacionariedad en covarianza” y “estacionariedad”, al igual que se hizo durante el desarrollo del curso.↩︎

  2. Corresponde resaltar, sin embargo, que la relación entre el área que se encuentra por debajo del Espectro/Periodograma y la Varianza de la serie se plantea para series estacionarias, propiedad que claramente no caracteriza a la serie en análisis.↩︎

  3. La utilización de las funciones de detección de anómalos cuando se incluye las estacionalidades produce advertencias de llegar al número máximo de iteraciones, junto con una cantidad de puntos anómalos sugeridos superior a 10, lo que constituye los motivos para indagar sobre los atípicos previo a modelar la estacionalidad.↩︎

  4. Se probó ajustar el modelo sin forzar \(\phi_1 = \phi_2 = 0\), no resultando significativos \(\phi_1\) y \(\phi_2\), razón por la que se los dejó fijos en \(0\)↩︎

  5. Se utilizó el paquete tso a efectos de identificar los outliers y su tipo.↩︎

  6. La utilización de un \(\text{AR}(1)\) o \(\text{MA}(1)\) en la parte estacional produce modelos con Criterios de Información prácticamente iguales.↩︎

  7. Se recuerda que en este caso el set de entrenamiento está compuesto por las observaciones hasta diciembre de 2024, mientras que el de prueba o test está integrado por las tres observaciones disponibles para 2025.↩︎

  8. Que ahora está constituido por las observaciones hasta diciembre de 2023.↩︎

  9. Ahora integrado por observaciones hasta Junio de 2024, tal que se pueda incluir el efecto del atípico de este último mes en la predicción.↩︎

  10. Y por ende se estableció el orden del modelo, se fijó los coeficientes en \(0\) que correspondiesen así como se señaló los outliers identificados en la especificación que la función x13 utilizó como insumo. Se desactivó otras funcionalidades, como la aplicación de logaritmo o los efectos calendario.↩︎

  11. Al ser outliers de tipo aditivo y de cambio transitorio los mismos quedan incluídos en el componente irregular y por ende son apreciables en la serie desestacionalizada.↩︎